收录于话题
#大数据成神之路
175个内容
这些题目是一个知识星球的球友发给我的,其中有几个题帮着解答了一下。对部分题目也做了一点修正,希望对大家有帮助。
如果你不知道如何准备面试,那么看看这个《剑谱总纲 | 大数据方向学习面试知识图谱》。
年假马上来临,我相信有不少读者都在准备或者考虑面试,无论如何不妨收藏一下。
如果你某个题目不知道答案,那么就去搜一下,如果搜不到,在公众号回复【加群】,可以加到群里寻求小伙伴们的求助。或者扫最下面的二维码加小助手好友并留言,有时间后会回复你。
顺便多提一句,【计算机基础和语言基础】请大家务必重视,如果你不是计算机专业,那么这些东西都要平时多看看。
这130个题暂时没有答案,很多题目《大数据技术与架构》都发过文章讲解过,有些也很简单,需要你自己去准备,去看,去思考,真正理解。不要老妄想别人喂,毕竟我们是人不是鸭子。
5、hadoop 和 spark 在处理数据时,处理出现内存溢出的方法有哪些?7、设计微信群发红包数据库表结构(包含表名称、字段名称、类型) 8、如何选型:业务场景、性能要求、维护和扩展性、成本、开源活跃度 13、hadoop 的组件有哪些?Yarn的调度器有哪些?16、RDD 中的 reducebyKey 与 groupByKey 哪个性能高?18、在 2.5亿个整数中,找出不重复的整数,注意:内存不足以容纳 2.5亿个整数。23、Flume taildirSorce 重复读取数据解决方法 29、impala 和 kudu 的适用场景,读写性能如何 32、Flink TaskManager 和 Job Manager 通信 34、Flink state 管理和 checkpoint 的流程 37、Flink watermark 如何处理乱序数据 39、Flink支持exactly-once 的 sink 和 source 41、Flink connect 和 join 区别 49、spark mkrdd和Parrallilaze函数区别 59、RocksDBStatebackend实现(源码级别) 60、HashMap、ConcurrentMap和 Hashtable 区别 61、Flink Checkpoint 是怎么做的,作用到算子还是chain 63、String、StringBuffer和 StringBuilder的区别 72、if 和 switch 的性能及 switch 支持的参数 76、Hadoop面试题汇总,大概都在这里(https://www.cnblogs.com/gala1021/p/8552850.html) 78、Time_wait状态?当server处理完client的请求后立刻closesocket此时会出现time_wait状态79、三次握手交换了什么?(SYN,ACK,SEQ,窗口大小) 3次握手建立链接,4次握手断开链接。81、concurrenthashmap 1.7和1.8?83、sql 去重方法(group by 、distinct、窗口函数) 84、哪些 Hive sql 不能在 Spark sql 上运行,看这里:https://spark.apache.org/docs/2.2.0/sql-programming-guide.html#unsupported-hive-functionality 86、事务隔离级别?可重复读、不可重复读、读未提交、串行化 87、Spark shuffle 和 Hadoop shuffle的异同 89、mysql btree 和 hash tree 的区别。btree 需要唯一主键,hash tree 适合>= 等,精确匹配,不适合范围检索 95、Flink 与 Spark streaming 对比 100、Flink:部署、API、状态、checkpoint、savepoint、watermark、重启策略、datastream 算子和优化、job和task状态 109、HashMap、ConcurrentMap和 Hashtable 区别 110、Flink Checkpoint 是怎么做的,作用到算子还是chain 112、String、StringBuffer和 StringBuilder的区别 如果这130个题目有超过30个答不上来,面壁思过吧。
-- MORE | 更多精彩文章 --
欢迎点赞+收藏+转发朋友圈素质三连
文章不错?点个【在看】吧! 👇